% Chapter Template

\chapter{Modélisation des extrêmes multivariés} % Main chapter title

\label{Chapter6} % Change X to a consecutive number; for referencing this chapter elsewhere, use \ref{ChapterX}

\lhead{Chapitre 6. \emph{Modélisation des extrêmes multivariés}} % Change X to a consecutive number; this is for the header on each page - perhaps a shortened title
Dans le chapitre précédent, nous avons vu comment les dépassements de seuil des pluies agrégées 5 jours peuvent être modélisés de façon indépendante sur chaque région. Cependant, il est nécessaire de modéliser la structure de dépendance entre les indices locaux dans le but d'obtenir la loi de l'indice national. Pour cela, nous allons modéliser la loi jointe des dépassements des pluies agrégées 5 jours. Cela est possible grâce à l'utilisation des copules qui permettent de modéliser la structure de dépendance de plusieurs variables aléatoires. 

\section{Théorie des copules}
\subsection{Théorème de Sklar}
\begin{definition} 
Une copule de dimension $m \geq 2$ est une application de $I^m=[0;1]^m$ à valeurs dans $I=[0;1]$ véfiant les propriétés suivantes :
\begin{enumerate}
\item Pour tout $u \in I^m $,
\begin{align}
C\left( u \right) &= 0 \hspace{0.2cm} \textit{si au moins une des ses coordonnées est nulle} \\
C\left( u \right) &= u_k \hspace{0.2cm}  \textit{si toutes les coordonnées de u sont égales à 1 sauf } u_k
\end{align}
\item Pour tout $a, b \in I^n$ tels que $a\leq b$,
\begin{equation}
V_C\left(\lbrack a;b \rbrack\right) = \Delta_{a_m}^{b_m}\Delta_{a_{m-1}}^{b_{m-1}}\dots\Delta_{a_1}^{b_1}C(u) \geq 0
\end{equation}
où $\Delta_{a_k}^{b_k}$ désigne la variation de la fonction C par rapport à la $k^{\textit{ième}}$ composante: 
\begin{equation*}
\Delta_{a_k}^{b_k}C(u)=C(u_1,\dots,u_{k-1},b_k,u_{k+1},\dots,u_m)-C(u_1,\dots,u_{k-1},a_k,u_{k+1},\dots,u_m)
\end{equation*}
\end{enumerate}
\begin{flushright}
$\square$
\end{flushright}
\end{definition}
\begin{theorem} \label{th: Sklar}\emph{\textbf{Théorème de Sklar en dimension n}}. Soit H une fonction de répartition de dimension $n$ ayant pour maginales $F_1,\dots,F_n$. Il existe alors une copule $C$ de dimension $n$ tellle que pour tout $x \in \bar{\mathbb{R}}^n$ :
\begin{equation} \label{eq: Copula n}
H(x_1,x_2,\dots,x_n)=C(F_1(x_1),F_2(x_2),\dots,F_n(x_n))
\end{equation}
Si $F_1,\dots,F_n $ sont toutes continues alors C est définie de manière unique.\\
Réciproquement, si C est une copule de dimension n et $F_1,\dots,F_n$ sont des fonctions de répartition unidimensionelles alors la fonction H définie par la relation \ref{eq: Copula n} est fonction de répartition d'une distribution de dimension n.
\begin{flushright}
$\square$
\end{flushright}
\end{theorem}

\noindent Par le théorème de Sklar \ref{th: Sklar}, trouver la loi multivariée de ($X_1,\dots,X_n$) revient à estimer les lois marginales ($F_1,\dots,F_n$) et se donner une copule. La copule permet en somme de relier les lois marginales à la loi multivariée en modélisant la structure de dépendance entre les lois marginales. Dans notre cas, étant donnée que nous disposons déjà des lois marginales de dépassements sur chaque cellule d'observation, il suffit d'introduire une copule afin de pouvoir donner la loi multivariée des dépassements.

\noindent Il existe une multitude de classes de copules mais nous nous sommes restreints à l'usage de la copule gaussienne multidimensionnelle car c'est la copule la plus utilisée pour modéliser . La copule gausienne, malgré ses limites en terme de dépendance de queue, nous permet de modéliser $27\times27/2 =378$ relations de dépendance entre les cellules d'observations. 
\subsection{Copule Gausienne}
%\begin{definition}\textbf{Copule Archimédienne} \\
%Soit $\Psi :[0:1]\longrightarrow R^*\cup \infty$, décroissante strictement et $\Psi(1)=0$, $\Psi(0)=\infty$. 
%Une copule archimédienne de générateur $\Psi$ est la fonction défini par :
%\begin{equation}
%\begin{array}{rccl}
%C : &[0;1]^n &\longrightarrow& [0;1] \\
%&\vec{u} &\longrightarrow& \Psi^{-1}(\Psi(u_1)+\dots+\Psi(u_n))
%\end{array}
%\end{equation}
%\begin{flushright}
%$\square$
%\end{flushright}
%\end{definition}
%La fonction de répartition d'une copule archimédienne bivariée $Z = C(U,V)$ est donnée par : 
%\begin{equation}
%K_C(t)=\mathbb{P}(Z\leq t)=t-\frac{h(t)}{h'(t)} 
%\end{equation}
%
%\begin{definition} \textbf{Copule de Gumbel bivariée}\\
%La copule de Gumbel est défnie par la fonction bivariée : 
%\begin{equation*}
%C_{\alpha}(u,v) = \exp \lbrace -\lbrack\left(-\ln u \right)^{\alpha} + \left(-\ln v \right)^{\alpha}\rbrack^{1/\alpha}\rbrace,
%\end{equation*}
%où $\alpha \geq 1$ est le paramètre de la copule. 
%\begin{flushright}
%$\square$
%\end{flushright}
%\end{definition}
%
%\begin{figure}[htbp]
%  \centering
%  \subfigure[$\alpha=2$]{
%   \includegraphics[width=6cm,height=6cm]{Figures/Chapter2/Gumbel_2.pdf}}
%  \subfigure[$\alpha=3$]{
%     \includegraphics[width=6cm,height=6cm]{Figures/Chapter2/Gumbel_3.pdf}}
%     \rule{35em}{0.5pt}
%  \caption[Copule de Gumbel]{Tracé (u,v) de couple de Gumbel}
%  \label{fig: Gumbel}
%\end{figure}
%
\begin{definition}\label{def: Copule Gausienne}
Soit $\phi$ la fonction de répartition de loi normale centrée réduite $N(0,1)$.
Soit $\Phi_{\Sigma}$ la distribution d'un vecteur gaussien centré de matrice de covariance $\Sigma$.
La copule gausienne multidimensionnelle, $C_{\Gamma}$ est définie par :
\begin{equation}
C_{\Gamma}(u)=\Phi_{\Sigma}(\phi^{-1}(u_1),\dots,\phi^{-1}(u_n))
\end{equation}
\flushright
$\square$
\end{definition}

\noindent La structure de dépendance entre les lois marginales se trouve dans la matrice de covariance. La figure \ref{fig: Copule Gaussienne} donne le nuage de points de la copule gaussienne bivariée en fonction du paramètre $\rho$ qui est le coefficient de corrélation entre deux marginales.  \footnote{Rappelons que dans le cas bivarié, $\Sigma$ de la définition \ref{def: Copule Gausienne} est $\left[\begin{array}{cc} 1 & \rho \\ \rho & 1 \\ \end{array}\right]$}
\begin{figure}[htbp]
  \centering
  \subfigure[$\rho=0,2$]{
   \includegraphics[scale=0.4]{Figures/Chapter2/normalCopula_plus_02.pdf}}
  \subfigure[$\rho=0,5$]{
     \includegraphics[scale=0.4]{Figures/Chapter2/normalCopula_plus_05.pdf}}
     \quad
   \subfigure[$\rho=0,8$]{
          \includegraphics[scale=0.4]{Figures/Chapter2/normalCopula_plus_08.pdf}}
   \subfigure[$\rho=-0,8$]{
          \includegraphics[scale=0.4]{Figures/Chapter2/normalCopula_minus_08.pdf}}
    \rule{35em}{0.5pt}
  \caption[Copule Gaussienne]{Tracé (u,v) de la Copule Gaussienne en fonction de $\rho$}
  \label{fig: Copule Gaussienne}
\end{figure}

\noindent Une copule gaussienne est donc caractérisée par sa matrice de covariance qui peut être estimées par les outils de mesures de dépendance suivantes : 
%Soit $X$, une variable aléatoire de loi $C_{\alpha}(U,V)$ où $U$, $V$ sont des variables aléatoires uniformes, nous avons les résultats suivants  :
%\begin{enumerate}
%\item La fonction génératrice de la copule de Gumbel de paramètre $\alpha$ est : $h(u)=(-ln(u))^{\alpha}$
%\item La fonction de répartition de $X$ est : $K_{C_{\alpha}}(t)= 1 -\frac{t\ln(t)}{\alpha}$
%\item La densité de $X$  est : $ K'_{C_{\alpha}}(t) = 1-\frac{1}{\alpha} - \frac{\ln(t)}{\alpha}$
%\item L'espérance de X est : $\mathbb{E}[X]=\frac{1}{2}\left(1-\frac{1}{2\alpha}\right)$
%\end{enumerate}

%\begin{definition} \textbf{Copule valeur extrême}\\
%Une copule $C_*$ est dite "valeur extrême" s'il existe une autre copule $C$ telle que : 
%\begin{equation}
%C_*=  \lim_{m\longrightarrow +\infty}C(u_1^{1/m},\dots,u_n^{1/m})
%\end{equation}
%%\end{definition}

\begin{definition}\textbf{Tau de Kendall} \\
Soient $X$, $Y$ deux variables aléatoires réelles, ($X_1$,$Y_1$) et ($X_2$,$Y_2$) deux versions indépendantes et même loi que (X,Y). Le tau de Kendall est défini par : 
\begin{equation}
%\tau = 4 \int_{[0;1]^n}C(u,v)dC(u,v) -1 = 4\mathbb{E}[C(U,V)] = 4\mathbb{E}[X]-1
\tau(X,Y)= \mathbb{P}\left((X_1-X_2)(Y_1-Y_2)>0\right)-\mathbb{P}\left((X_1-X_2)(Y_1-Y_2)<0\right)
\end{equation}
%où $U,V$  sont des variables aléatoires uniformes et $X$, la variable aléatoire $C(U,V)$.
\begin{flushright}
$\square$
\end{flushright}
\end{definition}
\noindent Le tau de Kendall peut s'interprêter comme la différence entre la probabilité des points concordants ((X,Y) de même signe) et la probabilité des points discordants ((X,Y) de signe opposé).
\begin{definition}\textbf{Rho de Spearman} \\
Soient $X$, $Y$ deux variables aléatoires réelles de fontions de répartitions $F$,$G$. Le Rho de Spearman, $\rho(X,Y)$ est la corrélation entre $F(X)$ et $G(Y)$. 
\begin{equation*}
\rho_S(X,Y)=\rho(F(X),G(Y))
\end{equation*}
\begin{flushright}
$\square$
\end{flushright}
\end{definition}
\begin{proposition}\label{prop: tau rho}
Soit $C$ une copule de ($X$,$Y$) que l'on suppose gausienne de matrice covariance $\left[\begin{array}{cc} 1 & \rho \\ \rho & 1 \\ \end{array}\right]$ où $\rho \in \left[-1;1\right]$ alors : 
\begin{enumerate}
\item $\tau_K(X,Y)=\frac{2}{\pi}\arcsin(\rho)$ 
\item $\rho_S(X,Y)=\frac{6}{\pi}\arcsin\left(\frac{\rho}{2}\right)$
%De plus, si la  copule $C$  est archimédienne  de générateur $\Psi$ alors on a:\\
%\begin{equation*}
%\tau(X,Y)=1+4\int \frac{\Psi}{\Psi '}(t)dt
%\end{equation*} 
%En particulier pour une copule de Gumbel de paramètre $\alpha$: 
%\begin{equation}
%\tau_{C_{\alpha}}=\tau(X,Y)= \frac{\alpha-1}{\alpha}
%\end{equation}
%\item $\rho(X,Y)=12\int_{[0;1]^2}\lbrace C(u,v)-uv\rbrace dudv = 12\int_{[0;1]^2}C(u,v)dudv - 3 $
\end{enumerate}
\end{proposition}

\noindent La proposition \ref{prop: tau rho} va nous permettre d'estimer les paramètres de la copule gaussienne modélisant la structure de dépendance des pluies extrêmes : \\
\begin{itemize}
\item Soit par la méthode d'inversion du tau de Kendall
\item Soit par la méthode d'inversion du rho de Spearman. \\
\end{itemize}
\noindent D'autres méthodes d'estimation existent pour la copule gaussienne mais étant donnée que la matrice de covariance à estimer est de dimension trop importante ($28\times 28$) dans notre cas, la méthode d'estimation par maximum de vraisemblance via résolution numérique n'a pas été retenue pour estimer la matrice de covariance. 

%\subsubsection{Simulation}
%Méthodologie pour simuler une copule gausienne de matrice de covariance $\Gamma$
%\begin{enumerate}
%\item Calculer la matrice A "racine carré" de $\Gamma$ : $\Gamma = AA^T $ (Factorisation de Cholesky)
%\item Générer n v.a iid $(Z_i)_{i=1,\dots,n}$ de loi $N(0,1)$ et poser $Z=(Z_1,\dots,Z_n)$
%\item Poser $X= AZ^T$ 
%\end{enumerate}
%\begin{proposition}
%$X$ est un vecteur gaussien, de dimension n, centré et de matrice de covariance $\Gamma$
%\end{proposition}

\section{Application à la modélisation de la dépendance des pluies}
Dans la partie \ref{subsec: GPD 28}, nous avons modélisé les lois marginales des dépassements des pluies de 5 jours de façon indépendante. Par le théorème de Sklar \ref{th: Sklar}, il suffit de modéliser la structure de dépendance des dépassements via une fonction de copule pour pouvoir donner la loi multivariée des dépassements des pluies 5 jours. Nous avons décidé de modéliser la distribution multivariée des dépassements de 100 mm et non de 250 mm. Cela a pour but d'éviter le problème d'occurence simultannée des événements locaux,  ce qui surestimerait l'indice national. Le choix de 100 mm se justifie par les arguments de la partie \ref{subsec: GPD 28}. La fonction de copule choisie est la copule gaussienne dont la matrice de covariance a été estimée par la méthode d'inversion de taux de Kendall. 

\noindent Nous avons simulé 10 000 fois la loi multivariée des dépassements des pluies agrégées 5 jours pour obtenir ensuite la distribution simulée de l'indice national. Sachant qu'il y a en moyenne 2 événements nationaux par an, un événement de période de retour 10 ans correspond à un événement de période de retour tous les 20 événements.
 \begin{table}[htbp]
\centering
\begin{tabular}{c|c|c}
Période de retour  & Quantile simulée & Indice national \\
\hline \hline
1/2 ans  & 75\%   & 4,94 \\
1/5 ans  & 90\%   & 14,23  \\
1/10 ans & 95\%   & 23,65  \\
1/20 ans & 97.5\% & 34,14 \\ 
\end{tabular}

\caption[Quantile et période de retour de l'indice national]{Quantile et période de retour de l'indice national}
\end{table}

\noindent Une fois obtenue la distribution de l'indice national par simulation, nous avons décidé de replacer les indices historiques dans la distribution simulée : 
\begin{table}[htbp]
\centering
\begin{tabular}{l|c|c|c}
\textbf{Catastrophe naturelle}&\textbf{Année}&\textbf{Indice national}& \textbf{Quantile}\\
\hline \hline 
Ouragan Michelle & 2001 & 0,43 & 36,23\%\\
Pluies torrentiells de Mai/Juin & 2002   & 10,96 & 86,79\%\\
Ouragan Ivan & 2004  &  4,39 & 73,16\% \\
Ouragan Wilma & 2005  & 10,17 & 85,85\%\\
Pluie torrentielle pré Dean & 2007  & 1,62 & 56,91\% \\
Tempête tropicale Gustav & 2008 &   8,26 & 82,88\% \\
Tempête tropicale Nicole& 2010 & 27,98 & 96,24\%\\
\hline
\hline
\end{tabular}
\caption[Classement des événements extrêmes selon la distribution simulée]{Répartition des événements extrêmes dans la distribution de l'indice national simulé}
\end{table}

\noindent Il est à noter que les événements extrêmes historiques n'appartiennent pas tous à la queue de distribution de l'indice simulé. Seul un événement extrême historique a une période de retour au delà des 10 ans : il s'agit de la tempête tropicale Nicole en 2010. On voit qu'il y a aussi des événements historiques dont la période de retour est très faible, par exemple le quantile associé à l'ouragan Michelle qui est seulement d'odre 36 \%. 

%\subsection{Simulation de l'indice national : Comparaison des distributions simulées}
%\begin{figure}[htbp]
%\centering
%   \includegraphics[scale=1,keepaspectratio=true]{Figures/Chapter2/comparaison_distribution_copula.pdf}
%  \caption[Comparaison de simulations de l'indice nationale]{Comparaison de simulation de l'indice nationale}
%  \label{fig: Comparaison}
%\end{figure}

%\subsubsection{Mesure de dépendance de queue}
%\begin{definition} Soit ($X$,$Y$) couple de variables aléatoires, $X\sim F$, $Y \sim G$ :
%\begin{enumerate}
%\item Le coefficient de queue supérieure de ($X$,$Y$) est :
%\begin{align*}
%\lambda_u &= \lim_{t \longrightarrow 1^- } \mathbb{P}\left(G(Y)>t | F(X)>t \right) \\
%&=\lim_{t \longrightarrow 1^- } \mathbb{P}\left(F(X)>t | G(Y)>t \right)\\
%&=\lim_{t \longrightarrow 1^- }\frac{ \mathbb{P}\left(G(Y)>t , F(X)>t \right)}{1-t}
%\end{align*}
%\item Le coefficient de queue inférieure de ($X$,$Y$) est :
%\begin{align*}
%\lambda_l &= \lim_{t \longrightarrow 0^+ } \mathbb{P}\left(G(Y)<t | F(X)<t \right) \\
%&=\lim_{t \longrightarrow 0^+ }\frac{ \mathbb{P}\left(G(Y)<t , F(X)<t \right)}{t}
%\end{align*}
%\end{enumerate}
%\end{definition}
%\begin{proposition}
%Si (X,Y) est une copule de Gumbel de paramètre $\alpha$ :
%\begin{equation}
%\left\lbrace
%\begin{array}{l}
%\lambda _l=0 \\
%\lambda _u = 2-2^{1/\alpha}
%\end{array}
%\right.
%\end{equation}
%\end{proposition}
%Symétrie à droite
%\begin{definition} Max-stable et copule extremes
%\end{definition}
%Théorem max-stable si et seulement si copule extreme
%Montrer la propriété max table copule gumbel
%--> Copule (X,Y) et (maxX,maxY) est la même
%\subsubsection{Estimation}
%\paragraph{Méthode maximum de vraisemblance}
%\paragraph{Inversion Kendall}